entitas

SWE-BENCH LITE

SWE-bench Lite adalah benchmark yang digunakan untuk mengukur kemampuan model AI dalam menyelesaikan tugas debugging perangkat lunak. Ini berisi serangkaian tugas yang dirancang untuk menguji efektivitas model dalam pemrograman.

DaftaratauMasuk

untuk mendapatkan artikel-artikel relevan yang dipersonalisasi

Teknologi

9 bulan lalu

236 dibaca

SWE-BENCH LITE

Studi Microsoft: AI Sulit Pecahkan Bug, Pemrogram Manusia Tetap Penting